模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2020, Vol. 33 Issue (7): 653-659    DOI: 10.16451/j.cnki.issn1003-6059.202007007
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于机器阅读理解的中文命名实体识别方法
刘奕洋1,2, 余正涛1,2, 高盛祥1,2, 郭军军1,2, 张亚飞1,2, 聂冰鸽1,2
1.昆明理工大学 信息工程与自动化学院 昆明 650504
2.昆明理工大学 云南省人工智能重点实验室 昆明 650504
Chinese Named Entity Recognition Method Based on Machine Reading Comprehension
LIU Yiyang1,2, YU Zhengtao1,2, GAO Shengxiang1,2, GUO Junjun1,2, ZHANG Yafei1,2, NIE Bingge1,2
1. Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650504
2. Yunnan Key Laboratory of Artificial Intelligence, Kunming University of Science and Technology, Kunming 650504

全文: PDF (770 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 针对现有命名实体识别方法主要考虑单个句子内的上下文信息,很少考虑文档级上下文影响的问题,文中提出基于机器阅读理解的中文命名实体识别方法,利用阅读理解思想,充分挖掘文档级的上下文特征,支撑实体识别.首先,针对每类实体,将实体识别任务转化为问答任务,构建问题、文本及实体答案三元组.然后,将三元组信息通过双向Transformer编码器进行预训练,再通过卷积神经网络捕捉文档级文本上下文信息.最后通过二进制分类器实现实体答案预测.在MSRA、人民日报公开数据集和自建数据集上的命名实体识别对比实验表明,文中方法性能较优,阅读理解思想对实体识别具有较好的作用.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
刘奕洋
余正涛
高盛祥
郭军军
张亚飞
聂冰鸽
关键词 命名实体识别(NER)阅读理解神经网络双向Transformer编码器(BERT)    
Abstract:The existing named entity recognition methods mainly consider the context information in a single sentence, rather than the impact of document-level context. Aiming at this problem, a Chinese named entity recognition method based on reading comprehension is proposed, and the idea of reading comprehension is utilized to fully mine document-level context features to support entity recognition. Firstly, for each type of entity, the entity recognition task is transformed into a question and answer task, and a triple of question, text and entity answer is constructed. Then, the triple information is passed through BERT pre-training and convolutional neural network to capture document-level text context information. Finally, the entity answer prediction is realized through the binary classifier. The experiment of named entity recognition on MSRA dataset, People's Daily public dataset and self-built dataset shows the better performance of the proposed method and the better effect of reading comprehension on entity recognition.
Key wordsNamed Entity Recognition(NER)    Reading Comprehension    Neural Network    Bidirectional Encoder Representation from Transformers(BERT)   
收稿日期: 2020-04-07     
ZTFLH: TP 391  
基金资助:国家重点研发计划项目(No.2018YFC0830105,2018YFC0830101,2018YFC0830100)、国家自然科学基金项目(No.61762056,61866020,61761026, 61972186)资助
通讯作者: 高盛祥,博士,副教授,主要研究方向为自然语言处理.E-mail:gaoshengxiang.yn@foxmail.com.   
作者简介: 刘奕洋,硕士研究生,主要研究方向为自然语言处理.E-mail:liuyiyang93@foxmail.com.余正涛,博士,教授,主要研究方向为自然语言处理、信息检索、机器翻译.E-mail:ztyu@hotmail.com.郭军军,博士,讲师,主要研究方向为自然语言处理.E-mail:guojjgb@163.com.张亚飞,博士,讲师,主要研究方向为自然语言处理、模式识别.E-mail:zyfeimail@163.com.聂冰鸽,硕士研究生,主要研究方向为自然语言处理.E-mail:niebg@foxmail.com.
引用本文:   
刘奕洋, 余正涛, 高盛祥, 郭军军, 张亚飞, 聂冰鸽. 基于机器阅读理解的中文命名实体识别方法[J]. 模式识别与人工智能, 2020, 33(7): 653-659. LIU Yiyang, YU Zhengtao, GAO Shengxiang, GUO Junjun, ZHANG Yafei, NIE Bingge. Chinese Named Entity Recognition Method Based on Machine Reading Comprehension. , 2020, 33(7): 653-659.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202007007      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2020/V33/I7/653
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn